Warning: preg_grep(): Compilation failed: quantifier does not follow a repeatable item at offset 142 in /var/www/tg-me/post.php on line 75 Библиотека собеса по Data Science | вопросы с собеседований | Telegram Webview: ds_interview_lib/957 -
❔Есть ли встроенные модели регрессии, которые напрямую работают с пропущенными данными
Да, некоторые модели на основе деревьев решений (включая реализации градиентного бустинга и случайных лесов) могут обрабатывать пропущенные данные внутренне. Например, определённые вариации деревьев решений могут использовать суррогатные разбиения или разделения по умолчанию для объектов с отсутствующими значениями признаков.
Это значит, что модель может выбрать альтернативный путь по дереву, если основной признак отсутствует.
Такие механизмы встроены, например, в: ➡️ XGBoost (можно задать missing), ➡️ LightGBM (имеет встроенную поддержку NaN), ➡️ CatBoost (автоматически обрабатывает пропуски).
Однако, несмотря на удобство, следует внимательно оценивать качество модели, особенно если: ➡️ пропусков много, ➡️ отсутствие значений связано с целевой переменной или другими признаками.
В таких случаях простая внутренняя обработка может быть недостаточной, и потребуется анализ природы пропусков или применение более обоснованных методов (импутация, маскирование и др.).
❔Есть ли встроенные модели регрессии, которые напрямую работают с пропущенными данными
Да, некоторые модели на основе деревьев решений (включая реализации градиентного бустинга и случайных лесов) могут обрабатывать пропущенные данные внутренне. Например, определённые вариации деревьев решений могут использовать суррогатные разбиения или разделения по умолчанию для объектов с отсутствующими значениями признаков.
Это значит, что модель может выбрать альтернативный путь по дереву, если основной признак отсутствует.
Такие механизмы встроены, например, в: ➡️ XGBoost (можно задать missing), ➡️ LightGBM (имеет встроенную поддержку NaN), ➡️ CatBoost (автоматически обрабатывает пропуски).
Однако, несмотря на удобство, следует внимательно оценивать качество модели, особенно если: ➡️ пропусков много, ➡️ отсутствие значений связано с целевой переменной или другими признаками.
В таких случаях простая внутренняя обработка может быть недостаточной, и потребуется анализ природы пропусков или применение более обоснованных методов (импутация, маскирование и др.).
The Singapore stock market has alternated between positive and negative finishes through the last five trading days since the end of the two-day winning streak in which it had added more than a dozen points or 0.4 percent. The Straits Times Index now sits just above the 3,060-point plateau and it's likely to see a narrow trading range on Monday.
Telegram Be The Next Best SPAC
I have no inside knowledge of a potential stock listing of the popular anti-Whatsapp messaging app, Telegram. But I know this much, judging by most people I talk to, especially crypto investors, if Telegram ever went public, people would gobble it up. I know I would. I’m waiting for it. So is Sergei Sergienko, who claims he owns $800,000 of Telegram’s pre-initial coin offering (ICO) tokens. “If Telegram does a SPAC IPO, there would be demand for this issue. It would probably outstrip the interest we saw during the ICO. Why? Because as of right now Telegram looks like a liberal application that can accept anyone - right after WhatsApp and others have turn on the censorship,” he says.
Библиотека собеса по Data Science | вопросы с собеседований from us